基于OECD准则对QSAR/QSPR模型几个重要问题的研究

基于OECD准则对QSAR/QSPR模型几个重要问题的研究

作者:师大云端图书馆 时间:2015-07-07 分类:期刊论文 喜欢:2996
师大云端图书馆

【摘要】摘要:本论文研究主要根据国际经济合作与发展组织(OECD)准则的要求,对定量构效关系(QSAR/QSPR)建模中的几个重要问题进行了研究;此外,对大规模分子结构数据库的生物标识亦进行了初步探索研究。本论文第一章首先阐述了OECD准则的内容及其对QSAR/QSPR研究的重要指导意义。然后,基于OECD准则要求,提出QSAR/QSPR建模中需要研究的几个重要问题,分别为提高QSAR/QSPR模型准确性和稳健性的方法、模型应用域定义方法及模型解释。第二章主要对提高线性QSAR/QSPR模型准确性和稳健性的方法进行研究。我们在非相关线性判别法(ULDA)的基础上进行改进,提出一种新的模型方法,此外,我们还提出了一种新的变量优选方法。我们采用新的模型方法结合变量优选方法(MULDA-RFE)对五组ADMET相关性质及一组Xa凝血因子抑制性数据进行QSAR/QSPR建模预测。结果表明,相对于原有算法,新方法得到的预测准确性和稳健性都有提高。通过与参考文献中一系列线性和非线性模型的比较,新方法的预测结果要优于或与这些模型的结果相当,说明新方法是一种很有效的QSAR/QSPR建模方法。同时,ULDA-RFE是线性的模型方法,在算法无歧义性和模型可解释性方面具有优势。第三章主要以气味分子在不同极性固定相上的保留指数为QSAR/QSPR模型研究对象,对提高偏最小二乘(PLS)线性模型预测的准确性和稳健性进行研究,并对影响气味分子在不同极性固定相保留行为的主要结构特征进行初步分析。得到以下结论:通过引入奇异样本检测的蒙特卡洛(MC)方法和随机青蛙变量选择方法,使模型的预测标准偏差(SDEP)大为减小,模型的R2和Q2参数都比之前有了很大的提高,这表明,奇异样本检测和变量选择方法使模型的预测准确性和稳健性都得到了极大改善。重取样预测误差的统计分布进一步证明了我们所提出的这一套QSAR/QSPR建模方法的有效性。第四章主要对QSAR/QSPR模型的准确性和稳健性、模型应用域定义方法及模型解释这几个重要问题进行比较全面的研究讨论。采用的QSAR/QSPR模型预测对象为四组重要的生物活性及毒性数据。在对QSAR/QSPR模型的准确性和稳健性的研究中,我们对比了几种有代表性的描述子和模型方法,结果表明:分子指纹结构描述符如MACCS和PubChem,在和适当的模型方法结合时,其模型准确性及稳健性与与计算型结构描述子Dragon相当;在各类模型方法中,支持向量机(SVM)和随机森林(RF)方法是两种准确性和稳健性较突出的方法。在模型应用域定义方法研究中,我们提出一种基于模型预测概率的应用域定义新方法,并与目前较为常用的基于分子结构相似性的应用域定义方法进行了对比,结果表明:我们所提出的模型应用域定义新方法要优于结构相似性的应用域定义方法;此外,在两种基于模型预测概率的方法中,Prob-SVM要稍优于Prob-RF方法。在模型解释的研究中,我们通过变量选择过程得到的重要分子描述子对各模型的构效关系进行一定分析解释。结果表明:采用适当的变量选择方法,能够为模型的解释提供极大的便利;而采用分子指纹作为结构描述子,可以更直观地挖掘与分子活性相关的结构信息,子结构类型描述子对于很多种类的活性预测有着重要作用。第五章中,我们对大规模分子结构数据库的生物活性标识作了初步的探索研究。主要采用PASS程序对接近一百万个化合物进行了生物活性标识;然后通过相似性结构搜索,对活性标识结果进行一定的检验和对比;此外,对活性标识中体现的生物化学型即优势骨架等有用信息也做了一定的挖掘。基于上述的工作,我们得到以下一些初步的结论和展望。我们提出了生物活性标识的重要性,但是,根据我们在大规模数据库生物标识实践中的初步结果分析,我们发现,大规模数据库的生物标识是一个极大的挑战,在今后还有很大的改善空间:需要在生物标识的准确性,生物活性标识的非黑箱性,生物标识的效率与准确性平衡、生物活性与生物化学型本体论定义等方面进行更深入研究。
【作者】陈宪;
【导师】梁逸曾;
【作者基本信息】中南大学,应用化学,2013,博士
【关键词】QSAR/QSPR;QSAR模型的OECD准则;模型方法;分子指纹;变量选择;模型应用域;支持向量机;模型解释;生物活性标识;

【参考文献】
[1]蒋柳权.1-溴丙烷暴露生物标志物及对大鼠坐骨神经影响的研究[D].山西医科大学,劳动卫生与环境卫生学,2013,硕士.
[2]黄会.隧道工程对昆明呈贡黑龙潭地下水系统的影响[D].成都理工大学,地质工程,2013,硕士.
[3]黄源.T市供水管网浊度特性的研究及其风险评估的应用[D].哈尔滨工业大学,建筑与土木工程,2013,硕士.
[4]魏宏博.菊科植物密齿千里光化学成分研究[D].兰州大学,有机化学,2013,硕士.
[5]沙凯.苏珊·朗格符号理论研究[D].南京师范大学,外国语言学及应用语言学,2014,博士.
[6]唐根.新川SDW25型引线键合机微夹钳问题研究[D].电子科技大学,集成电路工程(专业学位),2012,硕士.
[7]张晓玲,张志达.推钢机伺服控制系统[J].冶金自动化,1998,04:49-50.
[8]刘洪鹏.宝钢船板电子质保书及网上在线验签系统解决方案[J].冶金自动化,2014,03:8-12.
[9]贺佳琪.菲迪克合同条件下DAB争端解决机制研究[D].吉林大学,国际法学,2013,硕士.
[10]吴海涛.养老机构老年人的生活满意度及社会工作介入[D].中南民族大学,社会工作(专业学位),2013,硕士.
[11]程子安.塞来昔布对食管癌组织中P14~(ARF)、DAP-K和TIMP-3基因启动子甲基化状态、mRNA表达及细胞凋亡的影响[D].河北医科大学,外科学,2013,硕士.
[12]高兴月.我国未成年人刑事法律援助问题研究[D].吉林大学,法律,2014,硕士.
[13]陈德富.车牌识别的嵌入式系统研究[D].浙江工业大学,2006.
[14]盛四清,范林涛,李兴,檀晓林.基于帕累托最优的配电网多目标规划[J].电力系统自动化,2014,15:51-57.
[15]陈超.文化消费理念下城市现代商业中心的空间营造策略研究[D].哈尔滨工业大学,城市规划与设计,2013,硕士.
[16]周文.微动疲劳裂纹萌生特性及寿命预测[D].浙江工业大学,2007.
[17]董立新.沾益植烟土壤主要养分状况分析[D].湖南农业大学,作物学,2012,硕士.
[18]刘文捷.企业社会责任、企业生命周期与绩效[D].天津商业大学,会计学,2013,硕士.
[19]袁欢.非国家工作人员受贿罪的实践难题及解决[D].辽宁大学,刑法学,2012,硕士.
[20]张宁宁,任国君,张俊玲.煤气布袋除尘系统自动连续检漏仪的应用[J].炼铁.1998(04)
[21]李常海.初中学校量化管理体系的构建[D].河北大学,教育管理,2013,硕士.
[22]刘建美,马寿峰.基于有限理性的个体出行路径选择进化博弈[J].控制与决策,2009,10:1450-1454+1462.
[23]朱旭亚.低产尿素黄酒酵母代谢工程菌的构建[D].江南大学,发酵工程,2012,硕士.
[24]刘平平.超越死亡:对《我知道笼中的鸟儿为何歌唱》中玛雅死亡情结的解读[D].广东外语外贸大学,英语语言文学,2013,硕士.
[25]李晨希,刘 爽,张 甲,常新春.枪速对热障涂层组织性能及残余应力的影响[J].沈阳工业大学学报.
[26]汪静.胡明哲岩彩绘画的写意性研究[D].华中师范大学,美术学,2014,硕士.
[27]谢丹夏.Web上的数据挖掘技术和工具设计[J].计算机工程与应用,2001,06:85-87.
[28]杜正春,王延延,王毅,张睿.获取电力系统运行方式的多平衡机潮流模型[J].电力系统自动化,2014,16:41-46+87.
[29]杨晓兰.基于CVM的金沙遗址旅游资源非使用价值评估研究[D].首都师范大学,旅游管理,2014,硕士.
[30]于杨.改性分子筛负载TiO_2光催化活性的研究[D].沈阳理工大学,环境工程,2012,硕士.
[31]张金隆,卢新元,谢刚.基于RS的不完全信息IT项目风险决策算法研究[J].管理评论,2005,03:37-41+64.
[32]王净.益气活血方治疗不稳定性心绞痛(气虚血瘀证)的临床疗效观察[D].湖南中医药大学,中医内科学,2014,硕士.
[33]闫利军.不同草坪草对矿区中水灌溉及土壤改良措施的适应性评价研究[D].内蒙古农业大学,草畜种质资源学,2014,博士.
[34]宋军良.高中生物教学中发展学生的创造性思维研究[D].山东师范大学,学科教学论,2003,硕士.
[35]宋彬.华亭煤业集团发展战略研究[D].西安科技大学,工商管理,2013,硕士.
[36]曹丽华,唐伟,曹凯.鞍钢冷轧厂酸洗连轧联合机组过程自动化系统[J].冶金自动化,2002,04:33-37.
[37]荣丽华.内蒙古中部草原生态住区适宜规模及布局研究[D].西安建筑科技大学,城市规划与设计,2004,硕士.
[38]杨靖.COT架构的过流保护电路设计[D].西南交通大学,电路与系统,2014,硕士.
[39]曹恭祥.六盘山香水河小流域植被结构水文影响及其坡面尺度效应[D].中国林业科学研究院,生态学,2014,博士.
[40]柏冲.树莓状结构纳米复合粒子超疏水性表面的构建[D].齐鲁工业大学,高分子化学与物理,2014,硕士.
[41]李智萍.明清中原城镇史研究综述[J].中国社会经济史研究,2014,01:101-104.
[42]许鑫.司法回应民意的正当性研究[D].天津商业大学,法学理论,2013,硕士.
[43]蔡呈曦.民营科技企业融资与风险投资研究[D].浙江工业大学,技术经济及管理,2004,硕士.
[44]王鑫.网络服务提供者不作为侵权行为研究[D].复旦大学,法律,2012,硕士.
[45]卢志伟.数据挖掘技术在人力资源管理中的应用[D].天津财经学院,2002.
[46]陈智.复合蓄能材料制备及微胶囊溶液换热特性分析[D].南京大学,制冷及低温工程,2013,硕士.
[47]戴红昆.环境污染治理投资效率的综合评价研究[D].河北大学,人口、资源与环境经济学,2014,硕士.
[48]韩志军,王桂兰,周成虎,裴韬,蔡强,汪闽.我国地震信息系统建设发展方向探讨[J].地球物理学进展,2003,03:541-545.
[49]张登祥.中国艺术品市场创新研究[D].上海交通大学,高级工商管理(EMBA),2013,硕士.
[50]蔡雪霁.基于遗传算法的粘滞阻尼减震结构的抗震优化设计[D].广西科技大学,结构工程,2013,硕士.

相关推荐
更多